Các dự án và phát triển mở rộng liên quan Mạng từ

Mạng từ được kết nối với nhiều cơ sở dữ liệu của trang Web ngữ nghĩa (Semantic Web). Mạng từ cũng được tái sử dụng phổ biến thông qua các ánh xạ giữa các loạt đồng nghĩa của Mạng từ và các phạm trù từ các thực thể. Thông thường nhất, chỉ các phạm trù ở mức đỉnh của Mạng từ mới được ánh xạ. 

Hiệp hội Mạng từ toàn cầu

Hiệp hội Mạng từ toàn cầu (The Global WordNet Association (GWA)) [18] là tổ chức phi thương mại và công cộng (public) đã cung cấp một diễn đàn để thảo luận, chia sẻ và kết nối các mạng từ cho tất cả các ngôn ngữ trên thế giới. Hiệp hội Mạng từ toàn cầu cũng xúc tiến sự chuẩn hoá của các mạng từ thông qua các ngôn ngữ khác nhau để đảm bảo sự thống nhất trong việc liệt kê danh sách các loạt đồng nghĩa khác nhau trong ngôn ngữ của nhân loại. Hiệp hội Mạng từ toàn cầu giữ danh sách của các mạng từ đã phát triển trên khắp thế giới.[19]

Ngôn ngữ khác

  • CWN (Mạng từ tiếng Trung Quốc (Chinese Wordnet hay 中文詞彙網路)) do Trường Đại học Quốc gia Đài Loan tài trợ.[20] 
  • WOLF (Mạng từ Tự do tiếng Pháp (WordNet Libre du Français)), phiên bản tiếng Pháp của Mạng từ.[21] 
  • JAWS (Just Another WordNet Subset), phiên bản tiếng Pháp khác của Mạng từ [22] được xây dựng bằng cách sử dụng Wiktionary và khoảng trống ngữ nghĩa 
  • IndoWordNet [23] là cơ sở tri thức từ vựng đã được kết nối của các mạng từ của 18 ngôn ngữ đã được sắp xếp của Ấn Độ. 
  • Dự án MultiWordNet,[24] Mạng từ đa ngôn ngữ nhằm xây dựng Mạng từ tiếng Italia được liên kết chặt chẽ với Mạng từ Princeton. 
  • Dự án EuroWordNet [25] đã xây dựng Mạng từ cho nhiều ngôn ngữ châu Âu và đã kết nối chúng với nhau nhưng chúng không miễn phí. Dự án Mạng từ toàn cầu cố gắng sắp xếp việc xây dựng và kết nối của "các mạng từ" cho tất cả các ngôn ngữ.[26] Nhà in Đại học Oxford (Oxford University Press), Nhà xuất bản Từ điển tiếng Anh Oxford, đã có những kế hoạch xây dựng đối thủ trực tuyến của chính họ với WordNet. [cần dẫn nguồn] 
  • Dự án BalkaNet [27] đã xây dựng Mạng từ cho sáu ngôn ngữ châu Âu (Bulgaria, Czech, Hi Lạp, Romania, Thổ Nhĩ Kì và Serbia). Đối với dự án này, trình soạn thảo Mạng từ dựa trên XML dựng sẵn một cách tự do đã được phát triển. Trình soạn thảo này – VisDic – không còn nằm trong sự phát triển tích cực nữa, nhưng vẫn tiếp tục được sử dụng để xây dựng nhiều Mạng từ. Thế hệ tiếp theo của nó, DEBVisDic, là ứng dụng máy khách-máy chủ và hiện được sử dụng để soạn thảo nhiều Mạng từ (Tiếng Hà Lan trong dự án Cornetto, tiếng Phần Lan, tiếng Hungaria, một số ngôn ngữ châu Phi, tiếng Trung Quốc). 
  • UWN là cơ sở tri thức từ vựng đa ngôn ngữ được xây dựng một cách tự động mở rộng Mạng từ để bao phủ hơn một triệu từ trong nhiều ngôn ngữ khác nhau.[28]
  • Những dự án như BalkaNet và EuroWordNet làm cho việc xây dựng những mạng từ độc lập được nối kết với mạng từ gốc trở nên khả thi. Một trong số những dự án đó là Mạng từ tiếng Nga (Russian WordNet) do Đại học Giao thông vận tải bang Petersburg (Petersburg State University of Means of Communication) [29] tài trợ hay Mạng tiếng Nga (Russnet) [30] do Đại học bang Saint Petersburg (Saint Petersburg State University) tài trợ. 
  • FinnWordNet là phiên bản tiếng Phần Lan của Mạng từ mà ở đó tất cả các mục từ của Mạng từ tiếng Anh gốc đều được dịch ra.[31] 
  • GermaNet là phiên bản tiếng Đức của Mạng từ do Đại học Tübingen [32] phát triển. 
  • OpenWN-PT là phiên bản tiếng Bồ Đào Nha Braxin của Mạng từ gốc luôn có thể tải về một cách tự do theo giấy phép CC-BY-SA.[33] 
  • plWordNet [34] là phiên bản tiếng Ba Lan của Mạng từ do Đại học Công nghệ Wrocław (Wrocław University of Technology) phát triển. 
  • PolNet [35] là phiên bản tiếng Ba Lan của Mạng từ do Đại học Adam Mickiewicz ở Poznań (Adam Mickiewicz University) phát triển (phát hành theo giấy phép CC BY-NC-ND 3.0). 
  • BulNet là phiên bản tiếng Bulgaria của Mạng từ được phát triển tại Khoa Ngôn ngữ học máy tính của Viện Ngôn ngữ Bulgaria (Institute for Bulgarian Language), Viện Hàn lâm Khoa học Bulgaria (Bulgarian Academy of Sciences).[36] 

Dữ liệu kết nối

  • BabelNet,[37] một mạng ngữ nghĩa đa ngôn ngữ rất lớn với hàng triệu khái niệm thu được từ sự tích hợp Mạng từ và Wikipedia dựa trên thuật toán ánh xạ tự động. 
  • Bản thể học (ontology) SUMO [38] đã tạo ra sự ánh xạ giữa tất cả các loạt đồng nghĩa của Mạng từ, (bao gồm danh từ, động từ, tính từ và trạng từ), và các lớp SUMO (SUMO classes). Sự bổ sung gần nhất của việc ánh xạ cung cấp các kết nối cho tất cả các thuật ngữ chuyên biệt hơn trong MId-Level Ontology (MILO), cái đã phát triển SUMO. 
  • OpenCyc,[39] cơ sở tri thức và bản thể học mở của các tri thức ngữ nghĩa thông thường hàng ngày, gồm 12.000 thuật ngữ được kết nối với các nhóm đồng nghĩa của Mạng từ. 
  • DOLCE,[40] là module đầu tiên của Thư viện thực thể nền tảng của WonderWeb (WonderWeb Foundational Ontologies Library (WFOL)). Thực thể bậc cao này đã được phát triển dưới ánh sáng của các nguyên tắc bản thể học nghiêm ngặt đã được truyền cảm hứng từ truyền thống triết học với một định hướng rõ ràng hướng về ngôn ngữ và tri nhận. OntoWordNet [41] là kết quả của một nỗ lực thực nghiệm để sắp ngang hàng bậc cao của Mạng từ với DOLCE. Sự sắp hàng như vậy gợi ra ý rằng nó có thể dẫn tới một Mạng từ "ngọt ngào một cách bản thể", nghĩa là nghiêm ngặt hơn về mặt khái niệm, rõ ràng hơn về mặt tri nhận, và có thể khai thác được một cách hiệu quả hơn trong nhiều ứng dụng. 
  • DBpedia,[42] một cơ sở dữ liệu về thông tin cấu trúc, cũng được kết nối với Mạng từ. 
  • eXtended WordNet [43] là dự án của Đại học Texas ở Dallas (University of Texas) nhằm cải thiện Mạng từ bằng cách phân tích từ loại các chú giải về mặt ngữ nghĩa, từ đó làm cho thông tin chứa trong các định nghĩa này có giá trị cho hệ thống xử lý tri thức tự động. Nó cũng miễn phí với một sự cho phép tương tự như của Mạng từ. 
  • Dự án GCIDE đã xây dựng từ điển bằng cách kết hợp Từ điển của Webster đã hết quyền sở hữu trí tuệ từ năm 1913 với một vài định nghĩa Mạng từ và các dữ liệu do các tình nguyện viên cung cấp. Nó được phát hành theo giấy phép GPL được tự do phát hành bản sao chép và sửa chữa phiên bản với điều kiện các quyền tương tự sẽ được bảo lưu trong các công trình sao chép (copyleft license GPL). 
  • ImageNet là cơ sở dữ liệu hình ảnh được tổ chức theo tầng bậc của Mạng từ (hiện nay chỉ có danh từ), trong đó mỗi một nút của tầng bậc được mô tả bởi hàng trăm và hàng nghìn hình ảnh.[44] Hiện nay nó có trung bình hơn năm trăm hình ảnh mỗi nút. 
  • BioWordnet, phần mở rộng về y sinh của mạng từ đã bị bỏ rơi vì vấn đề về sự ổn định qua các phiên bản.[45] 
  • WikiTax2WordNet, sự ánh xạ giữa các loạt đồng nghĩa Mạng từ và các phạm trù Wikipedia.[46] 
  • WordNet++, nguồn tài nguyên gồm hàng triệu cạnh ngữ nghĩa thu được từ Wikipedia và các cặp kết nối của các loạt đồng nghĩa Mạng từ.[47] 
  • SentiWordNet, nguồn tài nguyên cho các ứng dụng khai thác quan điểm người ủng hộ đã thu được bằng cách gán nhãn tất cả các loạt đồng nghĩa của WordNet 3.0 tuỳ theo mức độ đánh giá tích cực, tiêu cực và trung hoà của họ.[48] 
  • ColorDict, là một ứng dụng của Android cho điện thoại di động sử dụng cơ sở dữ liệu mạng từ và các dữ liệu khác như Wikipedia. 
  • UBY-LMF, cơ sở dữ liệu của 10 nguồn tài nguyên bao gồm cả Mạng từ. 

Dự án liên quan

  • FrameNet là cơ sở dữ liệu chia sẻ một số thứ tương tự với và chỉ dẫn tới Mạng từ. 
  • Lexical markup framework (LMF) là tiêu chuẩn ISO được định rõ trong ISO/TC37 nhằm xác định khung chuẩn chung cho việc xây dựng từ điển, bao gồm cả Mạng từ. Tập con (subset) của LMF dành cho Mạng từ được gọi là LMF Mạng từ (Wordnet-LMF). Một minh hoạ cụ thể đã được thực hiện trong phạm vi dự án KYOTO.[49] 
  • UNL Programme là dự án do UNO đỡ đầu nhằm thống nhất dữ liệu ngữ nghĩa từ vựng của nhiều ngôn ngữ được sử dụng trong dịch máy và các hệ thống trích rút thông tin. 

Tài liệu tham khảo

WikiPedia: Mạng từ http://www.babylon.com/free-dictionaries/reference... //edwardbetts.com/find_link?q=M%E1%BA%A1ng_t%E1%BB... http://wordnet.princeton.edu/ http://wordnet.princeton.edu/wordnet/man/wnstats.7... http://www.phmartin.info http://www.lingoes.net/en/dictionary/dict_down.php... http://sourceforge.net/projects/goldendict/files/d... http://web.archive.org/web/20111021114613/http://w... http://arxiv.org/pdf/1404.5372 http://www.globalwordnet.org/gwa/wordnet_table.htm...